Sessão sobre Sistema Quarto, RStudio, Linguagem R e Git/GitHub
Conheça e Utilize o Terminal Git Bash
Apresentações
Sobre o Professor
Washington Santos da Silva
Formação Acadêmica
Doutorado em Estatística e Experimentação Agropecuária (UFLA)
Mestrado em Estatística e Experimentação Agropecuária (UFLA)
Graduação em Ecomomia (UFMG)
Áreas de Interesse
Estatística e Econometria Aplicadas
Análise de Séries Temporais
Inferência Bayesiana
Experiência Profissional
Longa carreira na administração pública federal
Sobre Vocês
Breve apresentação
Por favor, se apresentem e expliquem seus objetivos ao cursar esta disciplina.
Apresentação da Disciplina
Por quê?
Motivação
Vamos começar com algumas questões básicas e gerais:
Qual é o objetivo da econometria?
Por que economistas (ou outros profissionais) estudam ou usam econometria?
Uma resposta simples: Para aprender sobre o mundo usando dados.
Aprender sobre o mundo = Formular e responder perguntas, formular e questionar teorias e suposições.
“Mundo das Finanças”
Agenda de Pesquisa em Finanças
Os mercados financeiros incorporam rapidamente e completamente as informações disponíveis? (Testa a hipótese de eficiência informacional dos mercados.)
O modelo CAPM ou os modelos multifatoriais (como o APT) explicam melhor a variação dos retornos dos ativos? (Comparação empírica de modelos de precificação de ativos.)
Quais características das empresas explicam a probabilidade de inadimplência ou default corporativo?
Quais fatores específicos de uma empresa explicam os níveis de ESG (ambiental, social e governança) divulgados por empresas?
Empresas com maior presença de mulheres na liderança apresentam desempenho financeiro superior?
O nível de governança corporativa das empresas está associado a menor custo de capital?
Quais características das empresas determinam a escolha entre financiamento via dívida ou emissão de ações?
“Mundo das Finanças”
Agenda de Pesquisa em Finanças
Quais fatores explicam a decisão de pagar dividendos entre empresas listadas?
Firmas com maior investimento em inovação (R&D) apresentam maior valor de mercado ajustado ao risco?
Quais determinantes explicam os níveis de spread de crédito cobrados em empréstimos corporativos?
Empresas com maior participação de investidores institucionais apresentam menor manipulação contábil?
O que?
O Que um Econometrista Aplicado Precisa Saber?
Um econometrista aplicado† precisa dominar (pelo menos) três áreas:
A Teoria econômica.
A Teoria Estatística/Econométrica (hipóteses, métodos, limitações).
Como aplicar métodos teóricos a dados reais, o que exige conhecimento não trivial da teoria econômica e estatística/econométrica.
Métodos eficientes para análisar dados— aquisição, transformação, junção, sumarização, visualização e modelagem \(\rightarrow\) fluência em linguagens de programação.
Esta disciplina visa aprofundar seu conhecimento nas últimas três áreas.
* importa o arquivo de dadosuse"trade.dta", clear* cria nova variável replace distance = 5 if distance < 5* Cria log das variáveis generate log_trade = log(trade)generate log_distance = log(distance)* Regressão com EPs robustos à heterocedasticidadereg log_trade log_distance, robust
Por que usar a Linguagem R?
Modelo de Regressão em R (base)
# importa o arquivo de dadosdados <- haven::read_dta("trade.dta")# cria nova variáveldados$distance <-ifelse(dados$distance <5, 5, dados$distance)# Regressão linear com EPs robustos à heterocedasticidadem1 <-lm(log(trade) ~log(distance), data = dados)lmtest::coeftest(m1, vcov = sandwich::vcovHC(m1, type ="HC1"))# exibe o resultadosummary(m1)
Por que usar a Linguagem R?
Modelo de Regressão em Julia (Kezdi.jl)
# importa o arquivo de dados@use"trade.dta"# cria nova variável@replace distance =5@if distance <5# Cria log das variáveis @generate log_trade =log(trade)@generate log_distance =log(distance)# Regressão linear com EPs robustos à heterocedasticidade@regress log_trade log_distance, robust
Por que usar a Linguagem R?
Modelo de Regressão em Python
# carrega os módulos necessáriosimport pandas as pdimport mathimport statsmodels.api as smimport statsmodels.formula.api as smf# importa o arquivo de dadosdf = pd.read_stata("trade.dta")# cria nova variáveldf.loc[df["distance"] <5, "distance"] =5# Cria log das variáveis df["log_trade"] = df["trade"].apply(math.log)df["log_distance"] = df["distance"].apply(math.log)# Regressão linear com EPs robustos à heterocedasticidademodelo = smf.ols('log_trade ~ log_distance', data = df).fit(cov_type='HC3')print(modelo.summary())
Por que usar a Linguagem R?
Motivos
1. R é gratuita e código aberto — economizando dinheiro tanto para você quanto para a instituicão 💰💵💰.
2. R é reconhecida e demandada no mercado.
3. R é muito flexível e poderosa—adaptável a quase qualquer tarefa, por exemplo, econometria, análise de dados espaciais, aprendizagem estatística/de máquina, web scraping, limpeza de dados…
4. Eu 💖 R
Nota: Aprender R, e qualquer outra linguagem ou sistema, definitivamente requer tempo e esforço.
Introdução ao RStudio
O que é o RStudio?
Um Ambiente de Desenvolvimento Integrado (Integrated Development Environment, IDE)
Ambiente de desenvolvimento que suporta múltiplas linguagens (R, Python, SQL, C++…), mas é especialmente útil para a linguagem R.
Facilita a escrita de código, gerenciamento de projetos, criação de documentos computacionais (arquivos quarto, scripts, notebooks…)
Integra ferramentas para desenvolvimento, depuração e publicação
Interface do RStudio
Figura 1: Interface do RStudio: 4 Painéis
Interface do RStudio
Painel Superior Esquerdo: - Editor de código - Documentos Quarto (.qmd) - Scripts R (.R)
Painel Inferior Esquerdo: - Console R (execução de comandos) - Terminal (acesso ao sistema)
Painel Superior Direito: - Ambiente (variáveis e objetos) - Histórico de comandos - Conexões - Git (controle de versão)
Pacotes (ou bibliotecas) são coleções organizadas de funções/dados e documentação que estendem as funcionalidades básicas da linguagem R.
Repositórios principais:
CRAN (Comprehensive R Archive Network): repositório oficial com mais de 20.000 pacotes verificados e testados, cobrindo estatística, econometria e ciência de dados
Bioconductor: repositório especializado em bioinformática e análise de dados genômicos, com padrões rigorosos de qualidade e documentação
Instalação de Pacotes R
Usando a função install.packages()
No console R do RStudio (atalho: Ctrl + 2), digite:
install.packages("tidyverse", "here", "fs")
Instalação de Pacotes R
Usando a Guia Packages
Para instalar pacotes usando a guia Packages no RStudio:
Clique na guia Packages.
Clique em Install Packages.
Digite o nome de cada pacote que deseja instalar separados por um espaço ou vírgula na caixa de texto, ou copie os pacotes abaixo e cole na caixa de texto:
tidyverse here fs
Projetos RStudio
O que são projetos RStudio?
Unidades organizacionais para seu trabalho
Cada projeto tem seu próprio diretório de trabalho
Facilita a organização de arquivos relacionados
Permite integração com controle de versão (Git)
Criando um projeto para a disciplina
Por que criar projetos estruturados?
Organização dos arquivos e códigos
Facilidade para compartilhar seu trabalho
Reprodutibilidade das análises
Integração com controle de versão
Prática recomendada
RStudio: Configurações Básicas
1. Definindo Git Bash como terminal padrão
Considerando que você já tenha instalado Git for Windows, siga os passos abaixo:
Clique em Tools → Global Options no menu superior
Clique na aba Terminal, terceira de baixo para cima
Na caixa New terminals open with, selecione Git Bash, em seguida, clique em Apply e depois em OK
Agora, sempre que você abrir um terminal no RStudio, ele será o terminal do Git Bash, que é mais completo e funcional.
Para abrir o terminal, clique na aba Terminal no painel inferior esquerdo do RStudio.
Para verificar se o terminal está funcionando corretamente, digite git --version e pressione Enter. Você deve ver a versão do Git instalada.
RStudio: Configurações Básicas
2. Configurações básicas para Projetos RStudio
Clique em Tools → Global Options no menu superior
Na aba General, desmarque as seguintes opções:
“Restore most recently opened project at startup”
“Restore previously opened files on startup”
“Restore .Rdata into workspace at startup”
Em “Save workspace to .RData on exit”, selecione Never, em seguida, clique em Apply e depois em OK
Nota: A ideia é sempre começar com um ambiente limpo, sem objetos anteriores carregados.
Criando um projeto para a disciplina
Visão Geral
Vamos criar um projeto estruturado para a disciplina
O objetivo é criar uma estrutura padronizada para todos
Criando um projeto para a disciplina
Etapas do Processo
Configurar Git localmente (em sua máquina)
Criar repositório no GitHub
Clonar repositório para sua máquina local
Criar projeto RStudio a partir da pasta clonada
Criar estrutura de pastas e adicionar arquivos
Confirmar que tudo está pronto
Etapa 1: Configuração Local do Git
Configurando o Git Localmente
Antes de começar a usar o Git, é necessário fazer uma configuração inicial básica. Essa configuração identifica quem está fazendo as alterações e só precisa ser feita uma vez em cada computador.
Configure seu nome de usuário: Abra o Git Bash e;
Digite o comando:
git config --global user.name "nome_sobrenome"
Exemplo:
git config --global user.name "maria_silva"
Configure seu email:
Use o mesmo email que você usará (ou já usa) para sua conta no GitHub:
Verifique se a pasta foi criada usando o Windows Explorer.
Etapa 4: Criando um Projeto RStudio
4. Crie um Projeto RStudio usando a Pasta Clonada
Abra o RStudio
Clique em Project → New Project
Selecione Existing Directory
Clique em Browse e navegue até a pasta “visualizacao_dados_2025” que corresponde ao repositório que você acabou de clonar
Selecione a pasta e clique em Open
Clique em Create Project
Projeto Criado!
Etapa 5: Criar Estrutura de Pastas do Projeto
Estrutura do Projeto
Vamos criar um projeto RStudio para a disciplina com a seguinte estrutura:
mpa_ecnt2025/# raíz do projeto ├── atividades # atividades e avaliações├── dados # pasta para arquivos de dados│ ├── brutos # arquivos originais │ └── limpos # dados processados├── mpa_ecnt2025.Rproj # Arquivo do projeto RStudio├── relatorios # relatórios quarto (.qmd)│ ├── 01-relatorio # pasta do relatorio 1└── scripts # scripts R (.R)
Etapa 5: Criando a Estrutura de Pastas do Projeto
Com Git Bash
No terminal do RStudio, na raíz do seu projeto, execute:
Crie a pasta dados:
mkdir dados
Crie as subpastas “brutos” e “limpos”:
mkdir dados/brutosmkdir dados/limpos
Crie a Crie a pasta relatorios:
mkdir relatorios
Crie a subpasta “01-relatorio”
mkdir relatorios/01-relatorio
Crie a pasta “scripts”
mkdir scripts
Crie a pasta “atividades”
mkdir atividades
Etapa 5: Criando a Estrutura de Arquivos do Projeto
Baixe e Adicione o Primeiro Relatório
Acesse a página Cronograma do site da disclina e baixe o arquivo 01-relatorio.zip
Use o Windows Explorer para encontrar o arquivo baixado.
Descompacte o arquivo anterior e copie/recorte o arquivo 01-relatorio.qmd
Salve-o dentro da pasta “relatorios/01-relatorio”
Descompactando arquivos ZIP
Como descompactar arquivos ZIP?
Windows: Clique com o botão direito no arquivo ZIP → Extract All
MacOS: Dê um duplo clique no arquivo ZIP (em versões atuais, um arquivo zip é automaticamente descompactado após o download)
Linux: Clique com o botão direito → Extract Here ou use o comando unzip no terminal
Você pode verificar a estrutura do seu projeto usando a função dir_tree() do pacote fs.
Digite no console R:
fs::dir_tree()
Projeto Criado!
Parabéns!!! 👏
Você acaba de criar um projeto estruturado para a disciplina
Esta estrutura organizará nosso trabalho ao longo do semestre
Nos próximos encontros, aprenderemos a utilizar o RStudio,Sistema Quarto, R, Git e GitHub para análise de dados
Arquivo README.md
Definição e importância
É um arquivo de documentação em formato Markdown que serve como porta de entrada para seu repositório.
Normalmente, é o primeiro arquivo que as pessoas visualizam ao acessar seu repositório no GitHub.
Funciona como a “página inicial” do seu projeto, explicando:
O que é o projeto
Como utilizá-lo
Como ele está organizado
Outras informações relevantes
Benefícios para a disciplina:
Documenta seu trabalho de forma organizada
Facilita a avaliação do professor
Serve como portfólio para seu aprendizado
Desenvolve boas práticas de documentação
Como criar um arquivo markdown no RStudio?
Passos
No menu superior do RStudio clique em:
File -> New File -> Markdown File
Salve o arquivo com o nome README.md na raíz do seu projeto RStudio.
Template README.md para seu Projeto
# Mestrado Profissional em Administração ## Disciplina: Econometria Aplicada à Finanças Repositório pessoal da disciplina **Econometria Aplicada à Finanças** (60h) ofertada pelo Mestrado Profissional em Administração do IFMG – Campus Formiga. Este repositório consiste em um projeto RStudio que será utilizado para desenvolver as atividades práticas da disciplina, incluindo a criação de relatórios quarto, scripts R, entre outros.
README.md = “Diário de bordo”
Como manter seu README atualizado
Atualize o README.md à medida que a disciplina e o seu conhecimeto avançam
Utilize este arquivo como um “diário de bordo” do seu aprendizado
Adicione detalhes sobre desafios superados e soluções encontradas
Um “sistema de salvamento inteligente” que registra cada versão dos seus documentos.
Armazena apenas as mudanças entre versões, economizando espaço.
Funciona como uma “máquina do tempo” para seu trabalho.
Facilita o trabalho em equipe sem conflitos graves.
Comandos essenciais do Git
Comandos Essenciais
Os quatro comandos básicos que você usará com mais frequência (seu fluxo de trabalho padrão no Terminal do RStudio) são:
git status: consulta o estado atual dos seus arquivos
git add: prepara as mudanças para serem salvas
git commit: salva as mudanças no repositório local
git push origin main: envia as mudanças para o GitHub
Pense nestes comandos como um processo de 4 passos:
Verificar o que mudou (status).
Adicionar/Selecionar o que você quer salvar (add).
Salvar as mudanças localmente com uma descrição (commit).
Enviar para a nuvem/GitHub (push).
O que é GitHub?
Uma plataforma colaborativa baseada em Git
“Nuvem para projetos Git” - armazena seus repositórios online
Facilita compartilhamento e colaboração em projetos
Oferece ferramentas para revisão de código, discussão e documentação
Funciona como um portfólio para profissionais e estudantes
Fluxo de trabalho com Git e GitHub
Figura 3: Fluxo de trabalho Básico
Por que ignorar arquivos no Git?
Arquivos Desnecessários
Arquivos temporários ou gerados automaticamente
.Rhistory, .RData: Histórico e dados da sessão do R.
_cache/: Arquivos de cache que podem ser recriados.
.Rproj.user/: Configurações pessoais do RStudio.
Arquivos específicos do sistema operacional
Thumbs.db, .DS_Store: Arquivos de metadados do Windows/Mac.
Arquivos de saída/resultados
Documentos gerados (pdf…): São resultado do código, não o código em si.
Podem ser muito grandes, mudar frequentemente.
Copie/Cole no arquivo .gitignore do seu projeto
# Arquivos de sistema do WindowsThumbs.dbDesktop.ini# Arquivos de sistema do MacOS.DS_Store# Arquivos do RStudio.Rproj.user/.Rhistory.RData.Ruserdata# Arquivos temporários R*_cache//cache/# Arquivos de saída*.pdf*.html# Arquivos temporários*~.~lock.**.tmp*.bak
Benefícios de um bom .gitignore
Descrição
Repositórios mais limpos e leves
Menos arquivos = downloads e operações mais rápidas
Evita ocupar espaço com arquivos regeneráveis
Evita conflitos desnecessários
Arquivos de configuração pessoal causariam conflitos entre colaboradores
Arquivos binários (PDF, imagens) são difíceis de resolver em conflitos
Mantém o foco no que importa
Apenas o código-fonte e dados essenciais são versionados
Facilita a revisão de mudanças significativas
Publicando o Projeto RStudio no GitHub
Sincronizando o repositório local com o GitHub
Para publicar seu projeto RStudio no GitHub, você deve usar a seguinte sequência de comandos no terminal do RStudio:
No terminal do RStudio, verifique quais arquivos/pastas foram modificados ou criados com:
git status
Você pode adicionar todos os arquivos de uma vez com:
git add .
Execute git status novamente para confirmar que todos os arquivos foram adicionados (aparecerão em verde sob “Changes to be committed”):
git status
Se tudo estiver em verde, faça um commit com uma mensagem descritiva:
git commit -m"primeiro commit do projeto"
Se algum arquivo ou pasta ainda aparecer em vermelho após o segundo git status, adicione as pastas/arquivos um por um:
git add relatorios/01-relatorio/01-relatorio.qmd
Execute git status novamente e faça o commit quando todos os arquivos estiverem em verde:
git commit -m"primeiro commit do projeto"
Envie/Sincronize o repositório local atualizado para o GitHub:
git push origin main
Publicando o Projeto RStudio no GitHub
Vá até seu repositório no GitHub
Atualize a página do seu repositório no GitHub (F5)
Verifique se os arquivos foram enviados corretamente
Se tudo estiver correto, você verá a estrutura de pastas e arquivos que criou no RStudio
Boas práticas
Descrição
Versionando o que é importante
Código-fonte (arquivos .R, .py, .qmd)
Dados brutos (se não forem muito grandes)
Documentação (.md, README)
Ignorando o que é regenerável
Resultados que podem ser recriados executando o código
Configurações específicas do ambiente de cada usuário
É um sistema de publicação científica e técnica de código aberto que une texto narrativo e código para produzir documentos elegantemente formatados.
Com o Quarto, você pode criar diversos produtos:
Relatórios (html, pdf, docx )
Apresentações (RevealJS, Beamer,…)
Dashboards, websites, blogs e livros
O que é o sistema de publicação Quarto?
Figura 4: Sistema Quarto: um formato, diversos produtos.
Como funciona o Quarto?
Figura 5: Funcionamento do Sistema Quarto com a linguagem R.
Definição
Quando você renderiza um arquivo Quarto (que possui a extensão .qmd) contendo código R, primeiro o pacote knitr da linguagem R executa todas as células de código R e cria um novo arquivo markdown (.md), que inclui o código e sua saída.
O arquivo markdown gerado é então processado pelo programa pandoc, que gera o formato escolhido.
O botão Render do Rstudio encapsula essas ações e as executa na ordem correta para você.
Sistema Quarto e RStudio
Integração com RStudio
No RStudio, você pode criar e editar arquivos Quarto facilmente:
File → New File → Quarto Document/Presentation
Botão “Render” para renderizar o arquivo.
Por que usar o sistema Quarto?
Principais benefícios
Reprodutibilidade: Documenta todo o processo de análise de dados, garantindo que seu trabalho possa ser reproduzido.
Integração de código e narrativa: Combina texto explicativo, código e resultados em um único documento.
Múltiplos formatos de saída: Gera diferentes formatos (html, pdf, docs, apresentações) a partir do mesmo arquivo fonte.
Atualizações automáticas: Ao modificar dados ou código, basta renderizar o documento para atualizar todos os resultados.
Anatomia de um Arquivo Quarto
Anatomia de um Arquivo Quarto
Nota
Um arquivo Quarto (.qmd) consiste de três elementos fundamentais:
Metadados (YAML): Controla o formato e opções do documento
Texto em Markdown: O conteúdo narrativo do documento
Células de Código: Código executável com suas opções
Metadados (YAML)
---title:"Análise de Vendas"author:"Seu Nome"format:html:toc:truetheme: cosmoexecute:echo:truewarning:false---
Atenção à indentação!
A sintaxe YAML é sensível à indentação
Use sempre 2 espaços para aninhar elementos
Erros de indentação são a causa mais comum de problemas
Texto em Markdown
Código Markdown:
# Título da seçãoEste é um parágrafo com **texto em negrito** e *itálico*.- Item da lista- Outro item - Subitem[Link para tutorial](https://website.com)
# Gráfico de dispersão entre consumo (hwy) e potência (displ)# cria um sistema de coordenadas e elementos estéticos básicosggplot(ggplot2::mpg, aes(x = displ, y = hwy)) +# cria um gráfico de dispersãogeom_point() +# aplica um tema minimalista theme_minimal() +# define títulos e rótulos dos eixoslabs(title ="Consumo de Combustível x Potência do Motor",x ="Cilindrada do Motor",y ="Milhas por Galão")
Figura com legenda
Figura 6: Gráfico de dispersão entre consumo e potência do motor.
Opções comuns para células de código
Opção
Descrição
Exemplo
echo
Mostrar o código?
#| echo: true
eval
Executar o código?
#| eval: true
warning
Mostrar avisos?
#| warning: false
message
Mostrar mensagens?
#| message: false
label
Identificador único para uma figura
#| label: fig-analise
fig-cap
Legenda da figura
#| fig-cap: "Gráfico de dispersão"
Opções comuns para células de código
Configuração global
Defina opções de código para todo o documento no YAML:
execute:echo:falsewarning:falsemessage:false
Demonstração no RStudio
Vamos à prática!
Agora vamos ver um documento Quarto em ação no RStudio:
Abra o arquivo 01-relatorio.qmd
Recursos para Aprendizagem
Tutorial e Guia de Consulta Rápida
Para informações detalhadas sobre o sistema Quarto, consulte o tutorial sobre Quarto
Sessão sobre Sistema Quarto, RStudio + Git Bash, Linguagem R e Git/GitHub
Sessão Interativa
Conhecendo as Ferramentas
Abram o arquivo relatorios/01-relatorio/01-relatorio.qmd
Conheça e Utilize o Terminal Git Bash
Por que usar o Terminal (Shell)?
Motivos
Nesta seção, vamos explorar o terminal Git Bash integrado ao RStudio.
Por que usar o terminal?
Eficiência: Automatize tarefas repetitivas com comandos simples.
Reprodutibilidade: Documente cada passo do seu trabalho em scripts.
Controle: Tenha acesso direto a ferramentas poderosas como o Git.
Padrão da Indústria: Uma habilidade fundamental em ciência de dados e desenvolvimento de software.
Navegação
Comandos Básicos
Vamos começar aprendendo a “navegar” pelo sistema de arquivos do seu projeto.
pwd (print working directory): Mostra onde você está.
ls (list): Lista os arquivos e pastas no diretório atual.
cd (change directory): Muda de diretório.
Exemplo Prático:
Abra o RStudio e seu projeto da disciplina.
Verifique o diretório atual com pwd.
Liste o conteúdo com ls.
Navegue até a pasta de dados brutos com cd dados/brutos.
Liste os arquivos novamente com ls.
Criando e Organizando
Comandos Básicos
O terminal torna a organização do projeto rápida e transparente.
mkdir <nome_pasta>: Cria uma nova pasta.
touch <nome_arquivo>: Cria um arquivo vazio.
mv <origem> <destino>: Move ou renomeia um arquivo/pasta.
cp <origem> <destino>: Copia um arquivo/pasta.
Exemplo: Vamos criar uma pasta para uma nova atividade.
# Voltando para a raiz do projetocd ~# Criando a pasta da atividade 01mkdir atividades/01-atividade# Criando um rascunho para o script da atividadetouch atividades/01-atividade/rascunho.qmd
Inspecionando Arquivos
Comandos Básicos
Antes de carregar um conjunto de dados no R, você pode inspecioná-lo rapidamente.
head <arquivo>: Mostra as 10 primeiras linhas.
tail <arquivo>: Mostra as 10 últimas linhas.
wc -l <arquivo> (word count): Conta o número de linhas.
Exemplo: Vamos inspecionar nossos dados simulados.
# Navegue até a pasta de dados brutoscd dados/brutos# Veja o início do arquivohead dados_simulados.csv# Conta o numero de linhaswc-l dados_simulados.csv
O Operador “Pipe”
O “pipe” (|)
O “pipe” (|) é um dos conceitos mais poderosos do terminal. Ele permite que você “conecte” a saída de um comando à entrada de outro.
Formato: comando1 | comando2
Exemplo: Listar todos os arquivos e mostrar apenas os 5 primeiros.
# Voltando para a raiz do projetocd ~# O comando ls -R lista arquivos de forma recursivals-R|head-n 5
Isso nos dá uma visão rápida da estrutura do projeto sem poluir a tela
Removendo Arquivos e Pastas
Comandos Básicos
É possível remover arquivos e pastas diretamente pelo terminal. Use com cautela!
rm <arquivo> (remove): Remove um arquivo.
rmdir <pasta_vazia> (remove directory): Remove uma pasta vazia.
rm -r <pasta> (remove recursive): Remove uma pasta e todo o seu conteúdo. Este comando é perigoso e não tem volta!
Recomendação: Para remover, prefira a interface gráfica do RStudio ou do seu sistema operacional, especialmente no início.
Download de Arquivos
Comando curl e operador &&
Vamos aprender a baixar arquivos da web e a executar comandos em sequência.
curl -O <URL>: Baixa um arquivo da internet e o salva com o mesmo nome no diretório atual.
comando1 && comando2: O operador && (E lógico) executa o comando2apenas se o comando1 for bem-sucedido (terminar sem erros).
Exemplo Prático: Baixar um arquivo de dados e, em seguida, listar o conteúdo da pasta para confirmar o download.
# Navegue até a pasta de dados brutos, se ainda não estiver lácd dados/brutos# Baixa o arquivo e, se o download funcionar, lista o conteúdo da pastacurl-O https://raw.githubusercontent.com/datasciencemasters/go-datascience/master/data-raw/ibov.csv &&ls
Download de Arquivos
Exemplo Avançado
Operação: Baixar, descompactar e limpar.
Este padrão é muito comum para configurar projetos:
curl -L -O <URL>: O -L segue redirecionamentos de URL, garantindo que você baixe o arquivo do local correto.
unzip <arquivo.zip> -d <pasta>: Descompacta o arquivo em uma pasta específica.
rm <arquivo.zip>: Remove o arquivo .zip após a extração, mantendo o projeto limpo.
# Baixa, descompacta para a pasta do relatório e remove o .zipcurl-L-O https://washingtonsilva.github.io/site_bach_visdados2025/arquivos/01-relatorio.zip &&unzip 01-relatorio.zip -d relatorios/01-relatorio/ &&rm 01-relatorio.zip
Resumo e Próximos Passos
Resumo
O que vimos:
Navegar entre pastas (pwd, ls, cd).
Criar e organizar o projeto (mkdir, touch, mv).
Inspecionar dados rapidamente (head, wc).
Combinar comandos com o “pipe” (|).
Remover arquivos e pastas (rm, rmdir, rm -r).
Baixar arquivos da internet e executar comandos em sequência (curl, &&).
Próximos passos:
O terminal é uma ferramenta que, com a prática, pode ser tornar uma grande aliada na organização e automação do seu trabalho, fortalecendo a reprodutibilidade de suas análises.